GraphPad Prism 10 Curve Fitting Guide 您所在的位置:网站首页 graphpad prismroc文字对齐 GraphPad Prism 10 Curve Fitting Guide

GraphPad Prism 10 Curve Fitting Guide

2024-06-26 17:58| 来源: 网络整理| 查看: 265

逻辑回归中的ROC曲线用于确定预测新观察结果是“失败”(0)还是“成功”(1)的最佳临界值。如果您不熟悉ROC曲线,可花点时间理解。逻辑回归的ROC曲线示例如下所示。

首先,让我们来看看分类临界值实际上起什么作用。在您选择一个分类临界值时(假设您选择0.5),您的意思是想将模型中预测的概率等于或大于0.5的每个观察结果分类为“成功”。请注意,您会将符合该标准的观察结果分类为成功,而无论该结果是否实际观察为成功。令人困惑?别担心,事情没有听起来那么复杂。您在逻辑回归中观察到的结果只能是0或1。模型的预测概率可以采用0到1之间的所有可能值。因此,对于特定观察结果,模型的预测概率可能是0.51(成功概率的51%),但您的观察结果实际上是0(不成功)。我们将在立即讨论对观察结果进行正确或错误分类的重要性。现在,让我们回到ROC曲线。

曲线上的每个点代表一个不同的可能临界值,用于对预测值进行分类。您可以选择0到1之间的任何值作为临界值,但手动为每个可能的有意义的临界值进行该操作将会很累人。因此,ROC曲线所做的是查看导致数据集内任何观察结果分类发生变化的每一个可能的临界值(如果将分类临界值从0.5提高到0.6不会导致观察结果分类方式发生变化,则这并非一个值得考虑的步骤)。对于导致分类改变的各分类临界值,在图上放置一个点。但是那个点去哪里了?为回答该问题,让我们回到分类的结果上来,多了解一点分类的作用和分类表。

无论您选择哪种临界值,一定数量的数据行均将正确分类(您预测了该行的正确值),且一定数量的数据将错误分类。灵敏度和特异性是分别评估真阳性和真阴性比例的两项指标。换言之,灵敏度是使用特定临界值或真阳性率正确识别为1的1的比例。相反,特异性是您正确识别为0的0比例,或者真阴性率。

在数学上,其表示如下:

•灵敏度=(正确识别的1的数量)/(观察到的1的总数)

•特异性=(正确识别的0的数量)/(观察到的0的总数)

鉴于这些信息,我们可以将所有信息集中在一起理解ROC曲线。首先,我们确定ROC曲线的轴:Y轴只是灵敏度(或真阳性率),而X轴是1-特异性。尽管需要一些额外数学(和脑力)来证明,但可以证明1-特异性相当于假阳性率。

对于ROC曲线上的每个点(代表不同临界值),将该点的位置绘制为Y轴上该临界值的灵敏度,以及X轴上该临界值的1-特异性。因此,ROC曲线以图表方式显示了尝试最大化真阳性率与尝试最小化假阳性率之间的权衡。理想情况下,您将会获得接近100%灵敏度和特异性的临界值,这意味着您在所有情况下均能完美地预测。如果您获得该数据,则无需统计量,因为“成功”和“失败”很容易区分。事实上,使用逻辑回归,它甚至不可能拟合该模型。

最佳情况ROC曲线

最佳情况ROC看起来呈90度角。如果有这条曲线,则您可能无需统计量,因为区分0和1并不重要。请注意,在每一点上,灵敏度或特异性均为100%(即,1-特异性为0%)。事实上,这条曲线表明,具有灵敏度和特异性均在100%的临界值。另一种说法是没有假阳性和假阴性。该ROC曲线的AUC为1。

无预测能力的ROC曲线:

或者,最差情况ROC曲线(在Prism中)预测并未优于偶然结果,其在ROC曲线中呈45度直线。拟合模型预测结果并未比掷硬币得到的结果更好。另一种思考方法是,增加真阳性率(灵敏度)的唯一方法是同时增加相同数量的假阳性率(1-特异性):这完全算不上好方法。该ROC曲线的AUC为0.5。

最差情况ROC曲线:

请注意,在另外一种情况下,模型的表现(理论上)可能比随机机会差。请记住,ROC曲线描绘了模型的灵敏度和特异性,这两个值取决于受试者的分类。您可能会想象这样一个模型,在该模型中,“成功”(或1)通常预测为“失败”(或0),而非随机预测。在此情况下,模型仍能够识别不同结果组,但会对其进行错误分类(将1分类为0,反之亦然)。在最极端的情况下,一个模型可以完美地预测所有观察到的1均为0,所有观察到的0均为1。与“最佳情况ROC曲线”相反,下图显示,对于每个临界值,灵敏度或特异性(或两者)均为0%。该ROC曲线的AUC为0!

ROC曲线下面积

ROC曲线下面积(AUC)是一个综合指标,用于评估逻辑回归模型处于所有可能的临界值时对阳性和阴性结果的分类,范围为0.5-1,越高越好。人们有时会使用AUC作为评估模型预测能力的一种手段,尽管因为它代表了所有可能的临界值,而这在实践中不可行的,因此解释起来很困难。我们建议直接将ROC曲线解释为选择临界值的一种方法。

选择临界值

事实上,您只能为模型选择一个临界值。您如何确定使用哪个临界值?具体取决于您的具体情况。如果假阴性比假阳性更差,则选择灵敏度高的临界值(ROC图的Y轴值更高)。或者,如果假阳性更差,则选择特异性高的临界值(ROC图左侧的值)。

© 1995-2019 GraphPad Software, LLC. All rights reserved.



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有